大谷翔平選手のMLBにおける2021年本塁打量産ペースをExploratoryで可視化してみた
さて、連日スポーツニュースを賑わせている米国メジャーリーグ(MLB)、ロサンゼルスエンゼルス大谷翔平選手の本塁打量産ペース。これまでに日本人としてのMLBシーズン記録だった松井秀喜氏の31本(2004年)にシーズン前半戦だけで残り1本に肉薄するというものすごいスピード感で毎日の様に打ちまくり、ファンの皆を驚かせています。(下記ツイートは30号本塁打の時のもの)
talented, brilliant, incredible, amazing, show stopping, spectacular, never the same, totally unique, completely not ever been done before pic.twitter.com/qjXLSogrpE
— Los Angeles Angels (@Angels) July 3, 2021
当エントリでは、この『(本塁打量産の)ペースがすごいぞ』という点について『実際どんなもんなんだろう?』というのを調べてみたいと思います。
※ちなみにアイキャッチ画像は、この時(2018年)に現地で大谷選手登板試合を観戦した時に撮ったものを使いました。
目次
比較データの入手
まず初めに大谷選手のペースを把握するためのデータを入手するところから。
今回は『Baseball-Reference.com』というサイトからデータを拝借することにしました。
大谷翔平(2021年)
TOPページの検索窓から選手名で検索を行い、
選手個別の成績ページに遷移。[Game Logs]→該当年のリンク(今回の場合は2021年)を選択することにより、当該選手のその年の記録をまとめているページにアクセス出来ます。
今回は『ホームランの記録ペース』が見たいので『バッティング』の記録データを取得します。該当表の[Share&Export]からEXCELデータをダウンロード。
今回はせっかくなので歴代MLB選手の中から気になる選手(及び記録年)のデータも合わせて取得したいと思います。
松井秀喜(2004年)
- 松井秀喜(Hideki Matsui)/2004年
- 『MLB日本人選手』の投稿日時点での歴代シーズン最多本塁打記録を保持。
松井 秀喜(まつい ひでき、1974年(昭和49年)6月12日 - )は、石川県能美郡根上町(現在の能美市)出身の元プロ野球選手(外野手)。右投左打。現役引退後はニューヨーク・ヤンキースGM特別アドバイザーを務める。愛称は「GODZILLA」または「ゴジラ松井」。1990年代から2000年代の球界を代表する長距離打者で、日本プロ野球(以下:NPB)では読売ジャイアンツ、メジャーリーグベースボール(以下:MLB)ではニューヨーク・ヤンキースなどで活躍した。2009年のニューヨーク・ヤンキース時代にワールドシリーズ優勝を経験している。同年、アジア人初のワールドシリーズMVPを受賞した。2013年には国民栄誉賞を受賞。
2004年は前年16本塁打に終わったことを反省し、オフに大幅な筋肉増量に取り組んだ。そのため松井の身体、特に上半身は一回り大きくなった。それが功を奏し、重心の位置を下げてスタンスを広めにしたことにより、左方向への本塁打が増加。スプリングトレーニングでは本塁打と打点のチーム2冠王に輝いた(中略)最終的には日本人メジャーリーガー史上最多で前年のほぼ倍にあたる31本塁打と同最高のOPS.912を記録し、打率こそわずかに3割を下回ったが、三部門全てで前年を上回る好成績を残した。
バリー・ボンズ(2001年)
- バリー・ボンズ(Barry Lamar Bonds/2001年)
- シーズン73本塁打のMLB記録保持者。
バリー・ラマー・ボンズ(Barry Lamar Bonds, 1964年7月24日 - )は、アメリカ合衆国カリフォルニア州リバーサイド出身の元プロ野球選手(外野手)・コーチ。左投左打。MLB歴代1位記録となる通算762本塁打、シーズン73本塁打、長打率.863、出塁率.609、OPS1.422、史上唯一の500本塁打500盗塁など、そのキャリアを通じて数々の記録を残し、史上最も偉大な野球選手の一人とされる。
マーク・マグワイア(1998年)
- マーク・マグワイア(Mark David McGwire/1998年)
- バリー・ボンズが記録更新する前のMLBシーズン本塁打記録(70本)保持者。
マーク・デビッド・マグワイア(Mark David McGwire, 英語発音: /mɑrk ˈdeɪvɪd məˈgwaɪɚ/; 1963年10月1日 - )は、アメリカ合衆国カリフォルニア州ロサンゼルス郡ポモナ出身の元プロ野球選手(一塁手)。右投右打。愛称はビッグマック(Big Mac)。歴代2位の新人シーズン本塁打記録を持ち、1998年にサミー・ソーサとシーズン最多本塁打記録争いを繰り広げて当時の新記録となる1シーズン70本塁打を放った。通算583本塁打は引退当時歴代5位の実績。
マイク・トラウト(2018年)
- マイク・トラウト(Michael Nelson Trout/2018年)
- 現在エンゼルス在籍、大谷選手の同僚であり「MLB現役最高の選手」と評される。下記記事にて『その上で、「これはエンジェルス史上、6月までの最多本塁打であり、これまではマイク・トラウト(2018年)とアルバート・プホルス(2015年)による24本が球団記録だった」と、大谷が6月までの本塁打数で球団記録を更新したことを伝えた。』とあったので引用。
- 大谷翔平、プホルス、トラウトを上回る球団新記録を作る(J SPORTS) - Yahoo!ニュース
マイケル・ネルソン・トラウト(Michael Nelson Trout, 英語発音: [maɪk traʊt]; 1991年8月7日 - )は、アメリカ合衆国ニュージャージー州バインランド出身のプロ野球選手(外野手)。右投右打。MLBのロサンゼルス・エンゼルス所属。愛称はキーッド(Kiiiiid)。オールスター出場9回、MVP3回、シルバースラッガー賞7回を獲得。200本塁打200盗塁を達成。MLB現役最高の選手である。セイバーメトリクスのWAR(Wins Above Replacement)で毎年高い値を残しており5シーズンでリーグ1位を取っている(FanGraphsとBaseball-Referenceによる)。2019年には当時北米スポーツ史上最高額となる12年総額4億2650万ドルで契約延長した。
アルバート・プホルス(2015年)
- アルバート・プホルス(José Alberto "Albert" Pujols Alcántara/2015年)
- 今年までエンゼルスに在籍していたが、シーズン途中でドジャースに移籍。マイク・トラウト選手と同様の理由でピックアップ。
ホセ・アルベルト・プホルス・アルカンタラ(José Alberto "Albert" Pujols Alcántara、1980年1月16日 - )は、ドミニカ共和国サントドミンゴ出身のプロ野球選手(一塁手)。MLBのロサンゼルス・ドジャース所属。愛称はザ・マシーン。MLBにおける最高の打者の1人で、2001年のデビュー以降、2010年まで打率.300・30本塁打・100打点を10年連続で達成した。アメリカ合衆国外出身選手最多本塁打記録保持者。(中略)2019年7月28日のボルチモア・オリオールズ戦で通算650号本塁打を打ち、本塁打と二塁打で650本を達成した史上初の選手になった。
ベーブ・ルース(1927年)
- ベーブ・ルース(George Herman "Babe" Ruth, Jr/1927年)
- 「二刀流」という切り口で何かと大谷選手と比較・言及された御存知「野球の神様」。
ジョージ・ハーマン・ルース・ジュニア(George Herman "Babe" Ruth, Jr.、1895年2月6日 - 1948年8月16日)は、アメリカ合衆国メリーランド州ボルチモア出身の元プロ野球選手。愛称は「バンビーノ(The Bambino)」。童顔であったことから赤ん坊を表すベイビーをもじり「ベーブ(Babe)」とも呼ばれていた。最初にアメリカ野球殿堂入りを果たした5人の中の1人であり、本塁打50本以上のシーズン記録を初めて達成した。1927年に記録したシーズン60本塁打は、1961年にロジャー・マリスによって破られるまでの34年間、MLB最多記録であった。また、生涯通算本塁打数714本も1974年にハンク・アーロンに破られるまで39年間MLB最多であった。ブラックソックス事件による当時の球界への不信感を、豪快な本塁打の連発により払拭するにとどまらず、さらに野球人気を高めることに成功した。アメリカ国内において、数多いプロスポーツの一つに過ぎなくなっていた野球を、最大の人気スポーツにした事で「野球の神様」「アメリカ球界最大の巨人の1人」と評されている。
(ってか約100年前のデータもちゃんと残ってるってすげぇなぁ... )
以上、計7選手のデータをEXCELで入手後、1つのファイルに集約させました(手動で)。選手個人名等の情報はデータには含まれていなかったのでマージする際に先頭A列に『選手名(記録年)』の形で情報として付与しました。また試合日に関しては一部括弧付き数字が含まれているものがあったのでこの部分の除去を予め行っておきました(手動で)。
Exploratoryでのデータ可視化実践
今回の可視化にはExploratory v6.6.3を利用しました。
Exploratoryを起動、プロジェクトの新規作成を選択。
任意のプロジェクト名を入力して作成します。
データフレームの追加を行います。[ファイルデータ]を選択し、
前述の手順で作成したEXCELファイルを指定。
今回は単一ファイルとなるため、[選択]の上で対象ファイルのみを指定します。
データの確認後、[保存]→データフレームの作成を行います。
データの取り込みが完了しました。
[チャート]タブを選択し、可視化作成へと進みます。対象項目を指定しますがこの状態では基本的なグラフ生成までは不完全です。
- タイプ:ライン
- X軸:Rk
- Y軸:HR
- 色(グループ名):Player-and-Year(※今回新設した列)
キーとなるホームラン数(HR)を選手毎の累積値で表示させたいため、Y軸のHR値に対して追加設定を行います。項目メニューから[クイック表計算]→[累積合計値]を選択。
すると以下のように試合数に応じた形で選手毎のホームラン数が累積表示されるようになりました!タイトルと凡例の設定についてはチャートの設定より変更しています。ラインの表示をちょっとカスタマイズさせたいのでY軸のメニューから[マーカー]を選択。
表示内容のカスタマイズを以下の設定値で反映させます。[適用]押下。
チャートの見た目が変更されました!
チャートの内容を確認してみます。大谷選手の部分のラインにマウスを合わせてみると以下のように情報がポップアップ表示されました。
Exploratoryでは、日付系のデータを扱っている場合『タイムレンジスライダー』という機能が使えるようです。『大谷選手が30本打ったタイミングで、歴代の選手はどんなペースだったのか』をもう少し見やすく表示させるためにこの機能を使ってみたいと思います。Y軸の項目をDate(試合日)に変更の上、チャートの設定で『タイムレンジスライダー』を有効化し[適用]押下。すると以下のようにチャートの下に以下のような画面(別チャート)が表示されるようになりました。
タイムレンジスライダーを調整し、『大谷選手が30本目を打ったタイミング』にまでスライダーを調整してみます。MLBでは毎年の試合日程は微妙に開幕日程等変わっている(あと歴代データも全て"2021年の"日付で処理されてるっぽい)ので『日付』がキーになっていると若干の差異というか基準のブレが生じてしまいますが、おおよその目安にはなるかと思います。内容を見てみると大谷選手より遥かにハイペースで本塁打を量産しています。エグい。
- 1998年のマーク・マグワイア氏(最終的にシーズン70本塁打を達成)
- 2001年のバリー・ボンズ氏(マグワイア氏の記録を塗り替えるシーズン73本塁打を達成)
Exploratoryでは『トレンドライン』の機能を使うことも出来ます。試しに線形回帰を使って『今年いっぱいでどれくらい記録が増えそうか』を見てみました。162試合で53本。何かありえそうな数字ではありますね。
まとめ
という訳で、MLBエンゼルス大谷翔平選手の2021年本塁打量産ペースにちなんだ可視化記事の紹介でした。
今年のMLBオールスターでは、ホームラン競争に日本人では初めて大谷翔平選手が出場します。どこまで勝ち上がってくれるのか楽しみですし、シーズン後半戦も引き続きどこまでシーズン本塁打記録を伸ばしてくれるのかも非常に楽しみです!